Python处理PDF神器PyMuPDF库

79次阅读
没有评论

共计 440 个字符,预计需要花费 2 分钟才能阅读完成。

安装

pip install PyMuPDF -i https://pypi.douban.com/simple/

使用

import fitz  # 导入 PyMuPDF 库
filename = '100.pdf'
## 打开文档
doc = fitz.open(filename)

Document 属性和方法

属性 / 方法 描述
Document.page_count 页数(int)
Document.metadata 元数据(dict)
Document.get_toc() 获取目录(list)
Document.load_page() 读取页面

页面

page = doc.load_page(1)
links = page.get_links()  # 获取所有链接,返回字典列表
annots = page.annots()  # 获取注释
widgets = page.widgets()  # 获取表单字段
text = page.get_text('html')  # 获取页面信息
images = page.get_images()  # 获取图像列表值。列表中,元组第一位是 xref 值 

正文完
 0
三毛笔记
版权声明:本站原创文章,由 三毛笔记 于2023-08-13发表,共计440字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)